JSAI2026 3日目
https://gyazo.com/cb32aa2275df9bdbb1ffc1f298b0f057
ブログ
空間・系列データとAI
生成AIと研究自動化が拓く医歯薬学・生命科学DX
機械学習:グラフ学習と表現学習
プレナリーセッション
40周年記念企画
特別講演「AIの現在地と次の挑戦:科学・工学・社会の交点から」(岡野原 大輔 氏) Preferred Networksの国産AI
PLaMo VL
AIの現在地
生成AIは10年で驚異的に進化。さまざまな生成が統一的に扱われて急激に進化した。 生成モデル: x ~ p(X|C)
X: 生成対象、C: 条件
条件(制約、指示、対象ドメイン)が重要
帰納的アプローチ → 演繹的アプローチ
AIは淡々と少しずつ賢くなっている
予測可能な形で性能向上を続けている
このトレンドは向こう5~10年は続くだろう
同じ賢さあたりの価格は下がり続けている
1年あたり1/100 ~ 1/1000になる
ハードウェア、アルゴリズム、インフラの改善
LLMの長期タスク処理能力は4ヶ月ごとに倍増
主にソフトウェア開発
2030年には数週間単位のタスクをこなせると想定される
現在のAIを実現する技術
これまでの単語に後続する単語を順に予測するモデル
言語モデルで学習できる理由
次の単語をうまく予測するために文章や概念を理解する必要に駆られ、結果として玄弥その背後の概念を理解している
自己教師あり学習
アーキテクチャの進展
言語モデルのスケーリング則[Kaplan+ 2020]
予測可能な形で予測性能や後続タスク性能が改善される
創発により後続タスクの性能が急激に改善
論理思考
学習データの品質の改善
学習データの品質の差で計算量において数十倍の差
難しい数学、プログラムなどを解けるように学習 → 問題以外にも汎化し広い問題を解ける
計算基盤
100メガワット〜ギガワット級のデータセンターで学習される
AIデータセンター=「トークン工場」
AI推論の需要の爆発的な増加(2024後半〜)
推論需要 80倍
人類史上最大規模の計算需要であり、今後も増加し続けるとみられる
ソフトウェア開発領域だけでこの規模なのである
他の領域でも同様の進展をしたら...?
データセンターへの投資額は過去類がない規模
現在の課題
記憶の定着が不安定
評価・信頼性
ベンチマークの性能と実利用での性能がずれている
未知の状況・長期タスクでの失敗検出の困難性
理論理解
学習中に何が起きているのか十分にわかっていない
どの能力がいつどのように獲得されているのか
言語間・モーダル間・分野間の概念統合が未解明
データ制約
高品質な公開データは有限
学習したいデータは存在しないか公開されていない、偏っている
計算資源・エネルギー・半導体
GPU半導体の供給が追いつかない
DCの土地・冷却・建設期間
AIは観測・シミュレーション・実験・行動を通じて世界と相互作用しながら学習する必要がある 先に挙げた課題のすべてが同時に問われる
AI for ScienceとフィジカルAIは次世代AIの総合問題である
例: 材料科学
機械学習原子間ポテンシャル(MLIP)
PLaMo VL
個数の数え上げ、位置関係の理解
例: ロボット向け基盤モデル
VLA: Vision-Language-Action
社会・研究活動の変化
AIの登場で人は人力の知的労働かの制約から解放される
鉄道登場の以前以後の比較と同じ
AIが考え、調べ、作る
→ 知的労働量が桁違いに増える
AIによる知的労働の制約はなくなる
人が何を重要と考え、新しく問題を定義し、新しい世界を開拓するのは普遍
人はAIを使いこなすスキルを身につけ、柔軟な発想力、想像力を活かしていく とはいえ
Vibe coding: 実装・実験・検証の高速化
次世代AIに必要な研究課題
① 学習の再定式化
固定化した知能から、環境に合わせて変化し続ける知能へ
② 信頼できるAIシステム
ベンチマーク性能から、実環境での保証へ
③ 科学・物理世界との接続
データが少ない世界で、学び、検証し行動するAIへ
④ 計算基盤と社会基盤
社会インフラとなったAIを支えるための研究が必要
もう「最悪なくなっても大丈夫なもの」ではない
質疑
パーソナルモデル
共通データに含まれていない物の価値
"賢さ"の価値
人間に求められる賢さ
AIの結果を解釈し、判断をくだす
意識的に頭を鍛える機会が必要なのかもしれない
OJTのような、仕事をしながら学ぶ機会が減っていく